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摘要 :【 目 的】 为 了 给 林业 、 农 业 或 植物 检疫 等 行业 人 员 提 供 一 种 方便 快捷 的 昆虫 种 类 识别 方法 , 本 文 提出 了 一 种 
新 颖 的 鳞 翅 目 昆 虫 图 像 自动 识别 方法 。【 方 法 】 首 先 通 过 预 处 理 对 采集 的 昆虫 标本 图 像 去 除 背 景 ， 分割 出 双 翅 , 并 
对 翅 图 像 的 位 置 进行 校正 。 然 后 把 校正 后 的 翅 面 分 割 成 多 个 超 像素 , 用 每 个 超 像素 的 1, a, b 颜色 及 x, y 坐标 平 
均值 作为 其 特征 数据 。 接 下 来 用 稀 玖 编码 (SC) 算 法 训练 码 本 、 生 成 编码 并 汇集 成 特征 向 量 训练 量化 共 思 e 梯 度 反 
向 传播 神经 网 络 (SCC BPNN) , 并 用 得 到 的 BPNN 进行 分 类 识别 。[【 结果 该 方法 对 包含 576 个 样本 的 昆虫 图 像 的 
数据 库 进行 了 测试 , 取得 了 高 于 99% 的 识别 正确 率 , 并 有 理想 的 时 间 性 能 、 鲁 棱 性 及 稳定 性 。[【 结论 ] 实 验 结果 证 
明了 本 文 方法 在 识别 鳞 翅 目 昆 虫 图 像 上 的 有 效 性 。 
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Using sparse coding and SCG BPNN to recognize images of 


lepidopteran insects 
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Abstract: [Aim] In order to find a convenient way to recognize insect species for those worked in 
agriculture, forestry, plant quarantine etc., we developed a novel method to recognize images of 
lepidopteran insects. [ Methods] Firstly, the background of captured specimen image is removed and 
then the wings are cut out and calibrated in the preprocessing period. Then the calibrated wing is 
segmented into a number of super pixels, and mean values of l, a and b in color space and x and y in 
Cartesian coordinate system are kept as feature data. Following that, the sparse coding (SC) algorithm is 
used to train the codebook, generate the sparse codes that are pooled into a feature vector to train the 
SCG (Scaled Conjugate Gradient) Back Propagation Neural Network (BPNN). Finally the resulting 
BPNN is used to classify and recognize unknown insects. [ Results] The proposed method was tested in a 
database with 576 images with the best recognition rate over 99% , and the system also demonstrated ideal 
time performance, good robusticity and stability. [ Conclusion] The experimental results proved the 
efficiency of the proposed method in recognizing images of lepidopteran insects. 
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BR A BBE BE AA OA, WRTH 
WH, 已 知 约 20 万 种 , ARAR, the BE HP ie 
为 色彩 斑 澜 的 种 类 。 鳝 翅 目 昆虫 具有 重大 经 济 意 
X, 其 幼虫 多 数 取 食 植物 ,多 为 农林 害虫 ， 而 成 虫 
则 多 数 可 以 为 植物 传播 花粉 , HKR, PEAR RKA 


等 产 出 的 丝 是 重要 农 副 产品 。 为 有 效 促进 可 持续 发 
展 , 合理 利用 昆虫 , 使 其 为 人 类 服务 或 减少 其 对 人 
类 造成 的 危害 , 正确 识别 出 昆虫 便 至 关 重 要 。 然 而 
正确 识别 昆虫 有 赖 于 相当 的 昆虫 专业 知识 ,而 这 些 
专业 知识 需要 长 期 的 积累 。 目 前 具备 这 些 昆虫 分 类 
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2 识别 试验 结果 


本 文 提出 的 方法 在 CPU X Intel Core2 
2.16GHz, 1G 内 存 的 PC 机 上 用 MATLAB 实现 , 用 
于 测试 的 鲜 翅 目 图 像 数 据 库 共 有 从 10 类 昆虫 标本 
采集 得 到 的 576 张 样本 图 像 , 每 类 昆虫 的 图 像样 本 
数 最 少 的 有 47 张 , 最 多 的 有 69 张 。 这 10 类 昆虫 
AA kR PAR Agylla BAN R 
IR JA B IR Pangrapta 
umbrosa, WIRKE Bradina admixtalis Walker. SJE 
WK HK Pangrapta vasava, X Æ Ib W R Rhyacia 
auguridis, AZ ANR IR Scopula virgulata, $ DEJE K 
iR Pangrapta flavonacula. iW | 5 WR Eilema 
usuguronis HUK XLX tt Herculia glaucinalis, 3X ERE 
本 在 实验 中 被 分 为 训练 集 和 测试 集 , 训练 集 从 每 类 
样本 中 随机 抽取 ( 本文 分 别 对 30 个 和 40 个 训练 样 
本 进行 了 测试 ), 余下 的 样本 作为 测试 集 。 当 
BPNN 最 大 送 代 次 数 设置 为 500 时 ,用 测试 集 测试 
所 得 到 的 识别 率 如 表 1 Atay, BP 神经 网 络 的 性 能 
除了 跟 训练 函数 的 算法 有 关 , 还 跟 隐 层 的 节点 数 ， 


ramelana 、 


Pseudopanthrea corearia , 


AUR A OA, 因此 表 1 
给 出 了 不 同 隐 层 节点 数 和 不 同 传递 函数 下 的 识别 绪 
采 以 作 比 较 。 表 1 的 每 个 数据 单元 中 有 两 个 数据 ， 
其 中 左边 数据 为 每 类 训练 样本 数 为 30 个 的 识别 率 ， 
右边 数据 为 每 类 训练 样本 数 为 40 个 的 识别 率 , 我 
们 可 以 通过 比较 发 现 训练 样本 数 从 30 增加 到 40 
Ja, 多 数 情况 下 识别 性 能 明显 提高 , 男 外 需要 说 明 
的 是 , 因为 BPNN 训练 过 程 有 随机 性 , 每 次 测试 结 
果 会 有 较 小 波动 , 表 中 的 识别 率 是 出 现 频率 较 高 的 
测试 结果 , 并 非 最 佳 结果 。 从 表 1 可知 ， 当 输入 - 隐 
层 传递 阔 数 为 线性 函数 purelin AY, 隐 层 节点 数 对 
BP 网 络 性 能 没有 明显 关系 ,而 且 当 隐 层 -输出 非 线 
性 函数 时 , 识别 率 很 低 , 因此 不 适合 用 于 本 文 的 昆 
虫 识别 。 当 输入 - 隐 必 为 logsig KAT, BER 
点 数 对 识别 性 能 有 明显 的 影响 , 增加 隐 层 节点 数 可 
以 提高 识别 正确 率 , MARE ra BUA 20 增加 到 
30 时 , 性 能 提高 已 不 太 明 显 , 但 隐 层 节点 数 的 增加 
会 使 BP 网 络 的 计算 复杂 度 提高 ,时间 性 能 下 降 。 
从 表 中 数据 比较 可 知 ， 当 输入 - 隐 层 为 双 曲 正切 S 
AY PRL tansig, 隐 层 -输出 为 logsig, Aba TRAAN 
20 RF, 对 不 同 训练 样本 数 下 的 识别 性 能 最 为 理想 。 


表 1 不 同 参数 设置 下 SCG BPNN 的 识别 正确 率 ( %) 
Table 1 The recognition rates (%) of SCG BPNN under different parameters 


FETE PRY Transfer function 
输入 - 隐 层 隐 层 -输出 


Input layer to hidden layer Hidden layer to output layer 0 
tansig purelin 76.09 
logsig 96.74 
tansig 94.57 
logsig purelin 90.58 
logsig 96.38 
tansig 90.58 
purelin purelin 94.93 
logsig 33.70 
tansig 9.42 


表 2 给 出 了 本 文 算法 除 交 互 去 除 育 景 外 各 阶段 
所 消耗 的 时 间 ， 从 表 2 可知 , 昆虫 图 像 预 处 理 ( 不 
包括 背景 去 除 ) 时 间 约 用 了 62 ms, SLIC 超 像素 分 
AR TA 515 ms; 黎 玖 编码 分 为 训练 和 编码 两 个 阶 
Be, 训练 时 间 稍 长 ， 当 优化 码 本 和 编码 的 交 蔡 帮 代 
次 数 设 为 50 次 时 , 约 用 时 5 s， 而 编码 仅 用 时 32 


隐 层 节点 数 Number of hidden nodes 


20 30 
90. 34 93. 12 97.16 92.75 97.16 
95.45 98.55 99. 43 98.19 100 
90. 34 94.20 97.73 98.19 99.43 
40. 34 94.93 97.73 93.12 97.73 
99. 43 98.19 99. 43 98.19 99. 43 
93.75 95.29 98.30 98.55 98.30 
99.43 94.20 98.30 94.57 97.16 
16.48 29.71 47.16 24.64 40.34 
14.77 94.93 13.63 62.32 90.34 


ms; BPNN 也 分 为 训练 和 分 类 两 个 阶段 , 训练 阶段 
用 时 与 隐 层 节点 数 、 传递 函数 类 型 、 最 大 训练 次 数 
及 收敛 的 快慢 有 关 ， 当 最 大 训练 次 数 为 500 时 , 训 
练 时 间 约 5 ~35 s; BPNN 分 类 单个 样本 的 时 间 小 于 
1 ms， 相 对 于 其 他 步骤 可 忽略 不 计 。 实 际 使 用 时 ， 
稀 玖 编码 训练 生成 码 本 和 BPNN 训练 生成 网 络 只 需 
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3 ”结论 与 讨论 


本 文 提出 了 一 种 基于 超 像素 分 割 、 稀 玻 编 码 和 
SCG BP 神经 网 络 的 钱 翅 目 昆 虫 图 像 自 动 识别 方法 ， 
该 方法 在 包括 10 类 昆虫 共 576 幅 图 像 的 数据 库 中 
进行 了 测试 , 最 高 的 识别 正确 率 在 99% 以 上 ,同时 
具有 较 理 想 的 时 间 性 能 , 这 个 结 末 证 明了 本 文 提出 
的 方法 在 鲜 诸 目 昆虫 图 像 识 别 上 非常 有 效 , 具有 一 
定 的 推广 价值 。 

本 文 方法 的 背景 去 除 过程 需 要 有 少量 的 手动 操 
VE, 虽然 交互 量 不 大 , 但 相对 于 自动 分 割 仍 比 较 低 
效 , 今后 我 们 将 尝试 对 昆虫 的 前 背景 自动 分 割 进行 
研究 ,以 期 昆虫 图 像 识别 的 整个 流程 都 能 由 程序 目 
动 完成 ,进一步 提高 自动 化 程度 。 其 次 , EEE 
RENGAT, 程序 还 是 对 昆虫 标本 的 位 置 和 姿态 有 
一 定 的 依赖 , 当 昆虫 的 位 置 有 较 大 的 旋转 时 ,分离 
双 翅 的 算法 就 很 难 奏 效 , 所 以 , 今后 的 男 一 个 人 研究 
方 回 是 在 昆虫 标本 位 置 有 旗 转 时 仍 能 比较 满意 地 分 
离 出 双 翅 图 像 。 
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